import pandas as pd
import re

# 读取Excel文件
input_file = 'your_output_file.xlsx'
df = pd.read_excel(input_file)

# 定义需要删除的关键词列表
keywords_to_remove = ['承建', '总承包', '建营', '参建', '投建', '援建', '承揽', '完成', '建设', '运维', '交付', '中标', '签约', '签订', '签署']

# 创建一个正则表达式模式，用于匹配所有需要删除的关键词
pattern = re.compile(r'\b(?:' + '|'.join(map(re.escape, keywords_to_remove)) + r')\b')

# 遍历每一行，删除sub_title列中的关键词
df['sub_title'] = df['sub_title'].apply(lambda x: pattern.sub('', str(x)).strip())

# 保存修改后的DataFrame回Excel文件
output_file = 'your_output_file2.xlsx'
df.to_excel(output_file, index=False)

print(f"数据已保存到 {output_file}")